import requests
from pyquery import PyQuery

"""
 安装 pip install pyquery
 pyquery 是一个解析HTML的解析库，使用CSS选择器非常方便解析DOM节点
"""

"""
    初始化pyquery方式1 使用字符串
"""
html = """
<div>
    <ul>
         <li class="item-0">first item</li>
         <li class="item-1"><a href="link2.html">second item</a></li>
         <li class="item-0 active"><a href="link3.html"><span class="bold">third item</span></a></li>
         <li class="item-1 active"><a href="link4.html">fourth item</a></li>
         <li class="item-0"><a href="link5.html">fifth item</a></li>
     </ul>
 </div>
"""

doc = PyQuery(html)  # 初始化DOM对象
# print(doc)
# 将初始化的对象传入 CSS 选择器。在这个实例中，我们传入 li 节点，这样就可以选择所有的 li 节点。
print(doc('li'))

"""
    初始化pyquery方法2 使用url链接
    PyQuery 对象会首先请求这个 URL，然后用得到的 HTML 内容完成初始化，这其实就相当于用网页的源代码以字符串的形式传递给 PyQuery 类来初始化
"""
# doc = PyQuery(requests.get('http://cuiqingcai.com').text)
doc = PyQuery(url='http://cuiqingcai.com') # 处理处理同上
print(doc('title'))


"""
 初始化pyquery方法 3 传入本地文件
"""
# doc = PyQuery(filename='index.html') # 处理处理同上
# print(doc('title'))


